在高端制造企业的运维业务中,配件需求随机发生,且伴随有大量的零需求阶段,同时,对应的配件需求数据量小,且呈现出间歇性和块状分布的特点,导致现有时间序列预测方法难以有效预测配件需求走势。为解决该问题,提出了一种间歇性时间序列的可预测性评估及联合预测方法。首先,提出了一种新的间歇相似度指标,通过统计两条序列中“0”元素出现的频次和位置,并结合最大信息系数和平均需求间隔等度量指标,有效评估了序列的趋势信息和波动规律,并实现了对间歇性序列可预测性的量化;其次,基于该指标,构建了一个间歇相似度层次聚类方法来自适应地筛选相似性高、可预测性强的序列,剔除极度稀疏、无法预测的序列;此外,探索利用序列间的结构化信息,并构建多输出支持向量回归(M-SVR)模型,从而实现小样本下的间歇性序列联合预测;最后,分别在两个公开数据集(UCI礼品零售数据集和华为电脑配件数据集)和某大型制造企业实际配件售后数据集上进行实验。实验结果表明,相比多个典型的时间序列预测方法,所提方法可有效挖掘各类间歇性序列的可预测性,提高小样本间歇性序列的预测精度,从而为制造企业配件需求预测提供了一种新的解决方案。
目前生成式对抗网络(GAN)已经被用于图像的动漫风格转换。然而,现有基于GAN的动漫生成模型主要以日本动漫和美国动漫为对象,集中在写实风格的提取与生成,很少关注到中国风动漫中写意风格的迁移,因此限制了GAN在国内广大动漫制作市场中的应用。针对这一问题,通过将中国写意风格融入到GAN模型,提出了一种新的中国风动漫生成式对抗网络模型CCGAN,用以自动生成具有中国写意风格的动漫视频。首先,通过在生成器中增加反向残差块,构造了一个轻量级的深度神经网络模型,以降低视频生成的计算代价。其次,为了提取并迁移中国写意风格中图像边缘锐利、内容构造抽象、描边线条具有水墨质感等性质,在生成器中构造了灰度样式损失和颜色重建损失,以约束真实图像和中国风样例图像在风格上的高层语义一致性,并且在判别器中构造了灰度对抗损失和边缘促进对抗损失,以约束重构图像与样例图像保持相同的边缘特性。最终,采用Adam算法最小化上述损失函数,从而实现风格迁移,并将重构图像组合为视频。实验结果表明,与目前最具代表性的风格迁移模型CycleGAN与CartoonGAN相比,所提CCGAN可从以《中国唱诗班》为例的中国风动漫中有效地学习到中国写意风格,同时显著降低了计算代价,适合于大批量动漫视频的快速生成。
针对现有机器学习算法难以有效提高贯序不均衡数据分类问题中少类样本分类精度的问题,提出一种基于混合采样策略的在线贯序极限学习机。该算法可在提高少类样本分类精度的前提下,减少多类样本的分类精度损失,主要包括离线和在线两个阶段:离线阶段采用均衡采样策略,利用主曲线分别构建多类和少类样本的可信区域,在不改变样本分布特性的前提下,利用可信区域扩充少类样本和削减多类样本,进而得到均衡的离线样本集,建立初始模型;在线阶段仅对贯序到达的多类数据进行欠采样,根据样本重要度挑选最具价值的多类样本,进而动态更新网络权值。通过理论分析证明所提算法在理论上存在损失信息上界。采用UCI标准数据集和实际的澳门空气污染预报数据进行仿真实验,结果表明,与现有在线贯序极限学习机(OS-ELM)、极限学习机(ELM)和元认知在线贯序极限学习机(MCOS-ELM)算法相比,所提算法对少类样本的预测精度更高,且数值稳定性良好。
针对现有学习算法难以有效提高不均衡在线贯序数据中少类样本分类精度的问题,提出一种基于不均衡样本重构的加权在线贯序极限学习机。该算法从提取在线贯序数据的分布特性入手,主要包括离线和在线两个阶段:离线阶段主要采用主曲线构建少类样本的可信区域,并通过对该区域内样本进行过采样,来构建符合样本分布趋势的均衡样本集,进而建立初始模型;而在线阶段则对贯序到达的数据根据训练误差赋予各样本相应权重,同时动态更新网络权值。采用UCI标准数据集和澳门实测气象数据进行实验对比,结果表明,与现有在线贯序极限学习机(OS-ELM)、极限学习机(ELM)和元认知在线贯序极限学习机(MCOS-ELM)相比,所提算法对少类样本的识别能力更高,且所提算法的模型训练时间与其他三种算法相差不大。结果表明在不影响算法复杂度的情况下,所提算法能有效提高少类样本的分类精度。
针对现有回归多任务学习中各任务独立评估风险、缺乏统一约束条件的缺点,提出了一种具有自适应分组能力的超球多任务学习算法。该算法以极限学习机(ELM)为基础形式,首先引入超球损失函数对所有任务的风险进行统一评估,并采用迭代再权最小二乘法求解;其次,考虑到任务之间关联度存在差异,基于相关性强的任务其权重向量也较相似的假设,构建带分组结构的正则项,使得同组内的任务独立进行训练,最终将优化目标转为混合0-1规划问题,并采用多目标优化方法自动确定模型参数和最优分组结构。基于仿真数据和圆柱壳振动信号数据的测试结果表明,该算法可有效识别出任务中的分组结构,同时与现有算法相比,可明显提高回归模型的泛化能力。